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摘 要 : 2020 年 9 月 ， 中 共 中 央 办 公 厅 、 国 务 院 办 公 打 印发 了 《关于 加 快 推进 媒体 深度 融合 发 展 的 意见 》 中 明确 要 求 以 先进 
技术 引领 驱动 融合 发 展 。 本 文 探索 如 何 利 用 增强 现实 技术 为 移动 新 闻 客 户 端 赋 能 ， 从 而 实现 新 闻 内 容 的 精细 化 、 互 动 化 和 沉 


浸 化 ， 助 力 媒体 深度 融合 。 
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增强 现实 技术 ( Augmented Reality, 简称 AR ) 是 虚 
拟 场景 与 现实 场景 的 融合 技术 ，"20 世纪 五 六 十 年 代 ， 
美国 摄影 师 兼 发 明 家 Morton Heilig 用 他 拍摄 电影 的 经 验 ， 
发 明了 一 种 名 叫 “Sensorama Stimulator” 的 机 器 ， 它 可 使 
用 图 像 、 声 音 和 震动 让 使 用 者 感受 骑 着 摩托 车 风 驰 电 乞 
的 场景 。 以 此 为 契机 ，AR 也 拉 开 了 它 的 发 展 史 ，AR 技 
术 发 展 至 今 具备 虚拟 现实 融合 、 实 时 交互 、 环 境 感 知 等 
特征 ， 尤 其 是 三 维 跟踪 、 三 维 注册 是 其 最 重要 的 特征 。 
目前 多 用 于 游戏 、 文 旅 、 医 疗 、 工 业 、 军 事 等 应 用 场景 。 

几 年 前 一 款 风靡 全 球 的 手机 游戏 《Poke mon GO》 
让 人 们 第 一 次 在 个 人 移动 终端 上 感受 到 了 AR 的 奇妙 之 
处 ， 让 普通 用 户 了 解 了 增强 现实 这 个 概念 。 这 里 所 理解 
的 增强 现实 ， 是 用 虚拟 内 容 来 做 视觉 上 的 增强 ， 通 过 手 
机 屏幕 或 专业 眼镜 设备 ( 如 : Microsoft HoloLens 、Magic 
Leap 、Google Glass ) 来 重 现 。AR 技术 的 关键 在 于 设备 对 
周围 环境 的 感知 理解 ， 最 基础 的 是 确定 设备 自身 的 空间 
位 置 ， 再 进 阶 的 是 对 环境 进行 实时 重建 (SLAM ) ; 目前 
最 高 级 的 是 识别 、 认 知 和 交互 。 定 位 是 基础 ， 只 有 设备 
自身 的 位 置 精确 地 被 定位 ， 虚 拟 内 容 才 能 和 现实 场景 很 
好 地 、 实 时 地 进行 结合 ， 以 达到 足够 的 真实 感 。AR 主要 
是 对 现实 场景 的 增强 ， 而 非 完 全 的 虚拟 化 ， 让 虚拟 的 事 
物 融入 现实 场景 且 定 位 在 三 维 空间 里 ， 虚 拟 物 体 不 会 随 
着 观看 者 的 移动 而 移动 。 
1.AR 技术 原理 

目前 ，AR 需要 通过 外 部 设备 来 实现 ， 如 手机 ， 通 过 
获取 摄像 头 拍 摄 现实 场景 图 像 并 在 上 面 半 加 虚拟 物体 ， 
或 通过 专业 的 AR 设备 ， 如 AR 眼镜 、AR 头盔 ,也 可 将 
虚拟 物体 成 像 在 眼镜 里 。PAR 从 其 技术 实现 原理 上 可 以 
分 为 两 大 类 。 
1.1 利用 计算 机 视觉 技术 来 实现 AR 

利用 计算 机 视觉 来 实现 AR， 主 要 是 利用 CV 算法 把 
现实 世界 场景 与 屏幕 ( 如 手机 屏幕 、AR 眼镜 ) 之 间 形 成 
映射 关系 ， 使 得 屏幕 中 重 现 的 现实 场景 上 县 加 虚拟 三 维 
场景 ， 从 技术 实现 方式 上 可 分 为 两 类 。 


第 一 种 是 Marker-Based AR， 此 方法 必须 先 预 设 一 个 
基础 的 标记 物 ， 如 一 张 名 片 或 一 张 海 报 ， 然 后 把 该 标记 
物 放 到 现实 场景 中 的 任何 位 置 ， 这 等 于 在 现实 场景 中 定 
位 了 一 个 平面 ， 然 后 通过 手机 或 AR 眼镜 的 摄像 头 对 标 
记 物 进行 识别 ，CV 算法 会 将 标记 物 中 心 为 原点 的 坐标 系 
作为 模板 坐标 系 ， 从 而 将 模板 坐标 系 和 屏幕 坐标 系 建立 
映射 关系 ， 根 据 这 个 映射 关系 ， 在 屏幕 上 显示 出 的 虚拟 
三 维 场景 可 以 实现 依附 在 标记 物 上 的 效果 。 


图 1 Marker-Based AR 实现 原理 


第 二 种 Marker-Less AR， 其 实现 原理 与 上 述 第 一 种 
相 比 ， 不 需要 预先 制作 特殊 标记 物 ， 只 需 具备 任何 有 足 
够 多 特征 点 的 物体 。 比 如 : 身体 、 人 脸 、 手 势 、 车 辆 等 
各 类 物体 作为 基准 ， 通 过 机 器 学 习 (如 SURF、ORB、 
FERN 等 算法 ) 来 提取 物体 特征 点 , 并 且 记 住 这 些 特 征 点 。 
当 手 机 或 AR 眼镜 的 摄像 头 扫描 场景 ， 会 提取 场景 内 的 
物体 特征 点 并 与 机 器 学 习 记 住 的 物体 特征 点 进行 逐一 比 
对 ， 如 果 扫 描 到 的 特征 点 和 记录 的 特征 点 匹配 数量 达到 
或 超过 阔 值 ， 系 统 会 判断 为 识别 到 该 物体 ， 然 后 建立 映 
射 关 系 , 在 屏幕 上 就 可 以 将 虚拟 场景 依附 在 各 类 物体 上 ， 
美 颜 相机 中 人 脸 三 维 动 效 贴纸 效果 就 是 这 样 实现 的 。 
1.2 基于 地 理 位 置信 息 来 实现 AR(LBS-Based AR) 
其 原理 是 通过 移动 设备 的 GPS、 罗盘 、 陀 螺 仪 来 获 
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取 用 户 所 在 位 置 的 经 纬度 、 方 位 和 设备 倾斜 角度 ， 然 后 从 
数据 源 (如 : 在 线 地 图 ) 获取 该 位 置 附近 物体 ， 如 景点 、 
学 校 、 餐 饮 、 车 站 等 目标 POI 信息 ， 通 过 这 些 信息 建立 目 
标 物 体 在 现实 场景 中 的 平面 基准 ,之 后 再 通过 坐标 系 变换 ， 
建立 映射 关系 ， 以 此 在 屏幕 中 呈现 虚拟 场景 与 现实 场景 的 
组 合 、 释 加 。 此 方案 利用 移动 设备 的 GPS、 罗盘 、 陀 螺 仪 
等 传感器 来 实现 ， 摆 脱 了 对 固定 标记 物 的 依赖 ， 不 用 实时 
识别 标记 物 和 计算 特征 点 ， 在 移动 端 上 系统 性 能 和 用 户 体 
验 也 要 好 于 Marker-Based AR 和 Marker-Less AR。 

2.AR 主流 技术 解决 方案 

一 套 完整 的 移动 端 AR 技术 解决 方案 主要 包含 AR 引 
擎 (SDK ) 、AR 内 容 制作 、AR 内 容 识别 、AR 内 容 管理 
等 四 大 业务 模块 ， 其 中 最 为 关键 的 是 AR 引擎 ， 它 是 决 
定 AR 系统 是 否 能 实现 现实 空间 受 加 虚拟 场景 、SLAM ( 运 
动 跟踪 定位 ) ， 光 照 估 计 、 阴 影 等 功能 ， 同 时 又 可 基于 
人 工 智 能 技术 ， 通 过 人 脸 识别 、 图 像 识 别 、 动 作 识 别 等 
方式 ， 智 能 分 析 认 知 现实 场景 ， 达 到 增强 现实 效果 。 

大 多 数 AR 引 擎 都 是 以 Google ARCore、APPIE 
ARKit 为 基础 ， 它 们 分 别 用 于 支持 Android 设备 和 IOS 设 
备 ， 并 在 基础 上 再 次 封装 扩展 开发 ， 以 适 配 更 多 的 移动 
设备 和 应 用 系统 ， 市 场 主流 的 AR 引擎 主要 有 以 下 几 种 。 

(1 ) ARCore: Coogle 公司 研发 的 AR 引擎 ， 仅 可 用 
于 开发 Android 平台 上 的 AR 应 用 ,不 支持 10S 设备 ， 主 
要 实现 运动 追踪 、 平 面 追踪 、 点 云图 、 云 锚 点 、 光 照 估 计 、 
环境 探 针 、 人 脸 追 踪 、2D 图 片 追踪 、 人 物 遮 挡 等 。 

(2 ) ARKit: 苹果 公司 研发 的 AR 引擎 ， 只 支持 IOS 
设备 ， 用 于 开发 iPhone 和 iPad 平 台 上 的 AR 应用， 与 
ARCore 一 样 能 实现 运动 追踪 、3D 物体 追踪 、 平 面 追踪 、 
点 云图 、 云 锚 点 、 光 照 估 计 、 环 境 探 针 、 人 脸 追 踪 、 动 
作 捕 捉 等 。 品 

(3 ) Vurforia: 高 通 研发 的 AR 引擎 ， 它 包含 了 
ARCore、ARKit， 同 时 支持 Unity3D 创作 的 虚拟 场景 内 容 ， 
支持 Android、IOS 设备 ， 该 引擎 产生 的 业务 数据 可 在 云 
端 存 储 。 

(4) EasyAR: 视 展 信息 科技 研发 的 AR 引擎 ， 它 包 
含 了 ARCore、ARKit， 同 时 也 支持 Unity3D 创作 的 内 容 ， 
根据 应 用 场景 自 研 了 一 套 SLAM, 整套 AR 系统 支持 本 地 、 
云端 部 署 。 

(5) 阿里 AR: 阿里 巴巴 研发 的 AR 引擎 。 主 要 是 
在 2D 图 像 识 别 ，3D 物体 追踪 功能 ， 该 引擎 常见 的 应 用 
场景 是 支付 宝 过 年 扫 “ 福 ”活动 。 

(6) LandMarkAR: 是 字 节 跳动 研发 的 AR 引擎 ， 
主要 应 用 在 抖 音 App 内 拍摄 短视 频 为 城市 地 标 增添 AR 
特效 场景 。 

综 上 所 述 ， 主 流 AR 引擎 解决 方案 都 有 各 自 的 能 
特点 ， 也 存在 一 定 的 适 配 和 应 用 场景 限制 。 以 移动 客户 
端 为 例 ， 完 整 的 AR 技术 解决 方案 选 型 应 考虑 以 下 几 个 
方面 。 

(1) 引擎 通用 性 和 设备 适用 性 : 引擎 能 够 同时 支持 
ARkit 和 ARcore 双 平台 , 支持 大 部 分 Android 和 IOS 设备 ， 


如 有 游戏 需求 需 支 持 Unity。 

(2 ) 功能 的 丰富 性 : 能 文 持 表 面 跟踪 、 平 面 图 像 跟 
踪 、3D 物体 跟踪 、 运 动 跟踪 、 人 脸 跟 踪 ， 实 现 光 照 估计 、 
云 锚 点 、 点 云图 等 功能 。 

(3 ) 系统 接 入 的 易 用 性 : 采用 SDK 的 方式 接 人 移 
动 应 用 或 以 Web 的 方式 实现 扫描 识别 图 和 物体 来 呈现 
3D 动画 模型 、 视 频 、 图 片 、 文 字 、UI 按钮 等 效果 ， 并 且 
文 持 3D 模型 交互 。 

(4) 内 容 的 管理 和 分 发 : 支持 AR 文件 的 云端 存储 、 
处 理 、 审 核 ， 以 及 支持 CDN 分 发 。 

(5 ) AI 的 扩展 性 : 可 以 通过 AI 智能 分 析 认 知 现实 
场景 及 算法 训练 ， 比 如 表情 、 手 势 、 身 体 姿态 等 ， 从 而 
做 对 应 的 增强 显示 ， 达 到 增强 现实 效果 。 

以 天 目 新 闻 客户 端 为 例 ， 经 过 充分 的 技术 调研 ， 结 
合 客户 端 内 容 定 位 和 运营 需求 ， 采 用 EasyAR 的 整体 技术 
解决 方案 ， 该 方案 包括 四 个 主要 部 分 : AR 引擎 ( 移动 端 
SDK ) 、 内 容 脚 本 制作 系统 、 云 端 识 别管 理 系 统 ( Cloud 
Recognition Service ) 、 云 端 内 容 管理 系统 ( Operation 


Center ) 。 

AR 引擎 (移动 端 SDK ) 可 支持 IOS 和 Android 两 个 
平台 ， 适 配 目前 市 面 上 主流 机 型 ， 尤 其 对 众多 Android 机 
型 适 配 友好 。 该 引擎 主要 能 实现 下 列 功能 。 

(1 ) 平面 图 像 的 识别 和 跟踪 : 实时 识别 与 跟踪 有 纹 
理 的 平面 物体 ， 比 如 一 本 书 、 一 张 名 片 ， 甚 至 是 一 面 涂 
鸦 墙 ， 从 标准 图 像 动态 生成 跟踪 目标 ， 同 时 识别 和 跟踪 
多 个 目标 。 

(2) 3D 目标 的 识别 和 跟踪 : 实时 识别 和 跟踪 自然 
场景 中 有 丰富 纹理 的 三 维 物体 。 目 标 物 体 可 以 是 不 同形 
状 和 结构 ， 且 可 同时 识别 和 跟踪 多 个 3D 物体 。 

(3 ) 稠密 地 图 空间 定位 与 跟踪 : 利用 手机 相机 或 
AR 眼镜 相机 对 周围 环境 进行 三 维 稠密 重建 ， 得 到 稠密 的 
点 云 地 图 和 网 格 地 图 ， 利 用 稠密 空间 地 图 让 虚拟 物体 更 
好 的 融入 真实 环境 中 ， 以 实现 真实 物体 和 虚拟 物体 间 的 
正确 遮挡 、 碰 撞 等 AR 虚拟 场景 。 

(4) 稀 玻 地 图 空间 定位 与 跟踪 : 利用 手机 相机 或 
AR 眼镜 相机 扫描 周围 环境 ， 构 建 三 维 环境 点 云 ， 每 一 个 
三 维 点 都 记录 周围 的 局 部 视觉 信息 ， 最 终生 成 环境 的 三 
维 视 觉 地 图 并 提供 视觉 定位 跟踪 功能 ， 适 用 于 开发 持久 
化 AR 应 用 或 多 人 互动 AR 应 用 。 

(5 ) 运动 跟踪 : 可 持续 追踪 移动 设备 在 空间 中 的 位 
置 和 姿态 ， 将 虚拟 物体 和 真实 场景 实时 对 齐 于 同一 坐标 
系 ， 可 用 于 AR 展示 、AR 游戏 、AR 视频 或 拍照 等 应 用 
可 以 体验 到 虚拟 场景 和 真实 场景 融合 在 一 起 的 感受 。 义 
有 持久 化 AR 应 用 需求 ， 可 结合 EasyAR 稀 疏 空间 地 图 定 
位 与 跟踪 一 起 使 用 。 

除 上 述 主要 功能 外 ， 该 引擎 还 支持 提供 多 种 编 
程 语言 接口 ， 尤 其 提供 了 对 原生 开发 友好 的 Java 和 
Objective-C 编程 接口 ， 支 持 录 制 视频 ， 内 置 视频 播放 器 
且 支 持 H264、H.265 硬件 解码 ， 支 持 3ds Max、Maya、 
Unity 等 主流 三 维 场景 制作 工具 ， 针 对 移动 端 网 络 情况 支 
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持 多 种 压缩 算法 ， 提 升 用户 体 验 。 

内 容 脚本 制作 系统 支持 在 线 内 容 编辑 和 更 新 ， 包 
括 模型 编辑 器 、 场 景 编 辑 器 和 脚本 编辑 器 ， 支 持 通用 
javascript 脚本 ， 从 简单 的 模型 展示 到 复杂 的 小 游戏 都 可 
以 通过 脚本 编辑 器 来 完成 。 最 大 的 优点 是 AR 内 容 如 果 
有 变动 ， 只 需 更 新 AR 内 容 无 需 更 新 客户 端 ， 避 免 了 客 
户 端 打包 上 架 发 布 的 繁琐 过 程 。 

云端 识别 管理 系统 ( Cloud Recognition Service ) 会 将 
图 像 信 息 作为 识别 请 求 发 到 云端 识别 ， 服 务 器 检索 到 关 
联 图 库 里 与 之 匹配 的 目标 图 像 ， 然 后 调用 引擎 加 载 三 维 
虚拟 模型 等 ， 泻 染 出 相应 的 AR 效果 。 该 系统 可 实现 平 
面目 标识 别 、 手 势 识 别 、 姿 态 识别 等 多 种 AR 触发 方式 ， 
主要 由 识别 系统 、 监 控 系 统 、 统 计 系 统 等 业务 子 系统 构 
成 ， 其 中 识别 系统 是 CRS 的 核心 组 件 ， 包 括 管理 识别 目 
标 API 的 Targeter 系统 和 Searcher 系统 ， 以 及 底层 基于 
CV 特征 的 检索 系统 Retriever 系统 。 同 时 ， 还 能 为 业务 使 
用 方 提供 监控 、 统 计 业 务 ， 用 于 监控 识别 扫描 命中 分 析 
及 活跃 AR 扫描 设备 情况 。 


图 2 系统 部 署 图 (CRS 系统 与 所 依赖 的 系统 之 间 的 关系 ) 
云端 媒 资 内 容 管理 系统 (Operation Centen 是 提供 给 
SDK 相配 套 的 AR 内 容 包 进 行 存 储 管理 、 识 别 图 管理 、 
版 本 管理 、 内 容 分 发 、CDN 加 速 等 ， 同 时 与 云端 识别 管 
理 系统 协同 工作 ， 为 有 内 容 安全 管理 要 求 的 用 户 提供 了 
一 套 完 整 的 云端 私有 化 部 署 系统 。 
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图 3 系统 部 署 图 (OC 系统 与 所 依赖 的 系统 之 间 的 关系 ) 


3.AR 技术 实现 内 容 融合 创新 

2020 年 9 月， 中 共 中 央 办 公 厅 、 国 务 院 办 公 厅 印发 
的 《关于 加 快 推进 媒体 深度 融合 发 展 的 意见 》 中 明确 指 
出 要 以 先进 技术 引领 驱动 融合 发 展 ， 用 好 5G、 大 数据 、 
云 计算 、 物 联网 、 区 块 链 、 人 工 智能 等 信息 技术 革命 成 
果 ， 加 强 新 技术 在 新 闻 传 播 领域 的 前 脆性 研究 和 应 用 ， 
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推动 关键 核心 技术 自主 创新 。 "要 利用 AR、VR、 大 数据 、 
5G 等 技术 赋 能 内 容 跨 媒体 制作 与 呈现 ， 实 现 内 容 传播 精 
细 化 与 沉浸 化 。 

2018 年 4 月 ， 新 华 社 客户 端 发 布 AR 新 闻 《 习近平 


的 最 大 爱好 》， 用 户 使 用 AR 功能 扫描 二 代 身 份 证 ， 就 


2021 年 3 月 ， 天 目 新 闻 客户 端正 式 上 线 了 端 内 原生 
AR 功能 , 结合 当时 《寻找 浙江 金 名 片 》 的 主题 报道 活动 ， 
开发 了 AR 内容 和 运营 活动 场景 ， 用 户 只 需 打 开 客 户 端 
内 “ 扫 一 扫 ” 功 能 ,拍摄 “ 比 心 ”手势 ， 即 可 呈现 出 “ 浙 
江 九 张 金 名 片 ”， 并 可 参与 有 奖 答题 活动 ， 整 个 主题 系 
列 内 容 在 全 网 分 发 200 万 次 以 上 (如 下 图 所 示 ) 。 


奋斗 百年 路 。 eg 会 
启 航 新 征程 i 
Csrase 


(i 


AR 技术 给 融 媒体 时 代 带 来 的 是 一 种 全 新 的 、 前 所 未 
有 的 沉浸 感 ， 它 将 虚拟 内 容 与 现实 环境 相 结 合 ， 以 达到 
扩展 新 闻 内 容 信息 量 、 增 强 用 户 交 互 ， 从 而 让 用 户 直 接 
感知 并 触 达 新 闻 现场 ,这 是 AR 新 闻 内 容 最 突出 的 特点 。 

AR 新 闻 为 用 户 带 来 强烈 的 交互 感 ， 提 升 新 闻 的 趣味 
性 。 文 字 调动 的 是 用 户 的 视觉 ， 电 视 调 动 的 是 用 户 的 听 
觉 和 视觉 , AR 技术 在 内 容 触 达 上 直接 调动 了 用 户 的 视觉 、 
听觉 、 触 觉 等 多 种 感官 ， 在 新 闻 传 播 中 创新 实现 了 多 感 
定 联 动感 知 内 容 的 形态 ,让 用 户 沉 温 于 新 闻 现 场 ,体验 “最 
真实 ”的 新 闻 现 场 感 ， 虽然 AR 新 闻 部 分 提供 的 是 虚拟 
场景 , 但 它 调动 用 户 多 感官 的 感知 却 是 无 比 真实 的 。 同 时 ， 
内 容 被 AR 技术 赋 能 后 ， 借 助 强 交互 性 的 特点 ， 以 游戏 
的 方式 增加 新 闻 内 容 的 趣味 性 ， 使 年 轻 用 户 更 愿意 主动 
去 接受 AR 新 闻 ， 从 而 提升 新 闻 内 容 的 传播 力 。 

AR 新 闻 内 容 不 再 是 一 维 或 二 维 符号 的 叙述 ， 而 是 被 
三 维 甚 至 四 维 的 方式 立体 地 还 原 了 新 闻 发 生 的 现场 。AR 
新 闻 不 是 转述 新 闻 现 场 以 及 事件 的 详细 信息 ， 而 是 直接 
传递 新 闻 现场 给 用 户 , 让 用 户 自行 体验 现场 、 感 受 现场 ， 


对 新 闻 事件 的 了 解 和 感受 远 比 传统 新 闻 时 期 来 得 真实 和 
(下 转 第 42 页 ) 


